Exploración de los datos abiertos de COVID-19 México


Síguenos en nuestra página de Facebook "Análisis y visualización de datos"

https://www.facebook.com/An%C3%A1lisis-y-visualizaci%C3%B3n-de-datos-100602148375744/?ti=as

Introducción

La pandemia COVID-19 es uno de los peores desastres que nos ha tocado vivir en México y en el mundo pero todavía más lamentable es la infodemia que se encuentra presente. Si bien nos informamos en conferencias que dan las autoridades, siempre quedan algunas dudas que tal vez no se hablan por el tiempo o falta de preguntas correctas o algún interés particular. Para esto, la Secretaría de Salud en su página de COVID publicó los datos abiertos que utilizan para realizar sus análisis lo cual nos permite explorar más alla de lo que nos muestran, resolver nuestros propios interesés y tratar de estar nosotros informados y no creer lo que algún medio informa sin embargo algunas veces no es sencillo revisar estos datos.

En esta ocasión, decidí trabajar en los los Datos Abiertos de COVID-19 para estar informado pero aprovecho para compartirlo con ustedes para que puedan ver distintas visualizaciones y al mismo tiempo estar informados de algo en el que participamos todos. Al mismo tiempo, si tiene algun interés que quieran ver o explorar y que yo lo pueda hacer me pueden dejar su comentario y actulizare este trabajo en cuento pueda.

Por último, por el momento solo muestro exploración de los datos no modelos o predicciones por qué desde mi punto de vista sería muy irresponsable realizar modelos y predicciones epidemiológicas cuando no estoy especializado en el tema y más en una cuestión de tanta importancia.

En una rápida vista de los datos ya con un correcto formato se verían de la siguente manera (son 35 columnas por lo que puede que vean todas):

FECHA_ACTUALIZACION ID_REGISTRO ORIGEN SECTOR ENTIDAD_UM SEXO ENTIDAD_NAC ENTIDAD_RES TIPO_PACIENTE FECHA_INGRESO ... OBESIDAD RENAL_CRONICA TABAQUISMO OTRO_CASO RESULTADO MIGRANTE PAIS_NACIONALIDAD PAIS_ORIGEN UCI MUNICIPIO
0 2020-07-21 10a31d 2 ESTATAL 2 MUJER BAJA CALIFORNIA BAJA CALIFORNIA AMBULATORIA 2020-04-28 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA PLAYAS DE ROSARITO
1 2020-07-21 0d2fbe 2 ESTATAL 25 HOMBRE SINALOA SINALOA AMBULATORIA 2020-05-25 ... NO NO SI SI POSITIVO NO ESPECIFICADO México 99 NO APLICA CULIACÁN
2 2020-07-21 116171 2 IMSS 15 HOMBRE MEXICO MEXICO AMBULATORIA 2020-04-15 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO APLICA NICOLÁS ROMERO
3 2020-07-21 06d45b 2 IMSS 15 HOMBRE MEXICO MEXICO HOSPITALIZADO 2020-04-23 ... SI NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO CUAUTITLÁN IZCALLI
4 2020-07-21 05cbd0 2 IMSS 31 MUJER VERACRUZ DE IGNACIO DE LA LLAVE YUCATAN AMBULATORIA 2020-05-04 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO APLICA UMÁN

5 rows × 35 columns

Exploración de los datos

Los datos contienen a todos los sujetos que se han analizado hasta el momento tanto confirmados, negativos y pendientes.

El siguiente resultado contiene el número de sujetos(renglones) y el número de variables (columnas) presente:

(845272, 35)

La tabla contiene las siguientes columnas las cuales pueden revisar para generar nuevas preguntas dependiendo de su interés.

Index(['FECHA_ACTUALIZACION', 'ID_REGISTRO', 'ORIGEN', 'SECTOR', 'ENTIDAD_UM',
       'SEXO', 'ENTIDAD_NAC', 'ENTIDAD_RES', 'TIPO_PACIENTE', 'FECHA_INGRESO',
       'FECHA_SINTOMAS', 'FECHA_DEF', 'INTUBADO', 'NEUMONIA', 'EDAD',
       'NACIONALIDAD', 'EMBARAZO', 'HABLA_LENGUA_INDIG', 'DIABETES', 'EPOC',
       'ASMA', 'INMUSUPR', 'HIPERTENSION', 'OTRA_COM', 'CARDIOVASCULAR',
       'OBESIDAD', 'RENAL_CRONICA', 'TABAQUISMO', 'OTRO_CASO', 'RESULTADO',
       'MIGRANTE', 'PAIS_NACIONALIDAD', 'PAIS_ORIGEN', 'UCI', 'MUNICIPIO'],
      dtype='object')

Antes de continuar debemos aclarar algunas variables presentes en los datos que estan realacionadas con fechas:

  • FECHA_ACTUALIZACIÓN: Corresponde a la fecha de los datos publicados.
  • FECHA_INGRESO: Fecha en la que el paciente ingreso al hospital.
  • FECHA_SINTOMAS: Fecha en la que el paciente empezó con los síntomas.
  • FECHA_DEF: Presenta fecha sí el paciente desafortunadamente falleció.

Datos generales

A partir de la tabla anterior ocupamos la columna RESULTADO para contar a los sujetos con resultado a la prueba de COVID-19 positivos, negativos o pendientes.

Número de personas confirmadas con COVID-19: 356255
Número de personas con resultado negativo a COVID-19: 406151
Número de personas que esperan un resultado de la prueba de COVID-19: 82866
Número de fallecimientos con COVID-19 positivo: 40400
Número de sujetos analizados hasta el momento: 845272

Algo que notamos en los datos es la presencia de sujetos que tienen una confirmación en la prueba de COVID-19 pero que su fecha de SINTOMAS fue antes de los primeros casos de COVID-19 en México (finales de Febrero).

En una conferencia se aclaró que estas incosistencias se deben a errores al momento de registrar los datos.

FECHA_ACTUALIZACION ID_REGISTRO ORIGEN SECTOR ENTIDAD_UM SEXO ENTIDAD_NAC ENTIDAD_RES TIPO_PACIENTE FECHA_INGRESO ... OBESIDAD RENAL_CRONICA TABAQUISMO OTRO_CASO RESULTADO MIGRANTE PAIS_NACIONALIDAD PAIS_ORIGEN UCI MUNICIPIO
13278 2020-07-21 135d2f 2 SSA 25 HOMBRE CIUDAD DE MEXICO HIDALGO AMBULATORIA 2020-02-27 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA PACHUCA DE SOTO
18710 2020-07-21 07b5c5 1 IMSS 2 MUJER BAJA CALIFORNIA BAJA CALIFORNIA AMBULATORIA 2020-02-12 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO APLICA TIJUANA
48905 2020-07-21 17235f 2 IMSS 19 HOMBRE NUEVO LEON NUEVO LEON AMBULATORIA 2020-01-13 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO APLICA SAN NICOLÁS DE LOS GARZA
58732 2020-07-21 05f3d3 1 SSA 9 HOMBRE CIUDAD DE MEXICO CIUDAD DE MEXICO HOSPITALIZADO 2020-02-27 ... NO NO SI SI POSITIVO NO ESPECIFICADO México 99 SI IZTAPALAPA
59891 2020-07-21 189846 2 SSA 15 HOMBRE CIUDAD DE MEXICO MEXICO AMBULATORIA 2020-02-28 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA TLALNEPANTLA DE BAZ
63540 2020-07-21 044a42 2 SSA 9 HOMBRE CIUDAD DE MEXICO CIUDAD DE MEXICO AMBULATORIA 2020-02-27 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA GUSTAVO A. MADERO
104097 2020-07-21 1732a3 2 IMSS 2 MUJER BAJA CALIFORNIA BAJA CALIFORNIA HOSPITALIZADO 2020-04-14 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO TIJUANA
111827 2020-07-21 18ecd7 2 ISSSTE 9 HOMBRE CIUDAD DE MEXICO MEXICO HOSPITALIZADO 2020-04-01 ... NO NO NO NO POSITIVO NO ESPECIFICADO México 99 SI NEZAHUALCÓYOTL
128967 2020-07-21 0f634f 1 IMSS 25 MUJER SINALOA SINALOA AMBULATORIA 2020-01-29 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO APLICA CULIACÁN
137180 2020-07-21 04f68c 2 PRIVADA 15 HOMBRE NO ESPECIFICADO MEXICO HOSPITALIZADO 2020-03-04 ... NO NO NO NO POSITIVO NO ESPECIFICADO Italia 99 NO HUIXQUILUCAN
137185 2020-07-21 0aad01 2 SSA 7 MUJER CIUDAD DE MEXICO CHIAPAS AMBULATORIA 2020-02-29 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA TUXTLA GUTIÉRREZ
164526 2020-07-21 0d5181 1 IMSS 2 HOMBRE SONORA BAJA CALIFORNIA HOSPITALIZADO 2020-04-16 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO TIJUANA
175949 2020-07-21 06e286 2 SSA 5 MUJER COAHUILA DE ZARAGOZA COAHUILA DE ZARAGOZA AMBULATORIA 2020-02-28 ... NO NO NO NO POSITIVO NO ESPECIFICADO México 99 NO APLICA TORREÓN
250322 2020-07-21 194f98 2 ISSSTE 9 HOMBRE CIUDAD DE MEXICO CIUDAD DE MEXICO HOSPITALIZADO 2020-02-27 ... NO NO NO NO POSITIVO NO ESPECIFICADO México 99 NO MIGUEL HIDALGO
614047 2020-07-21 178775 2 SSA 21 MUJER PUEBLA PUEBLA AMBULATORIA 2020-04-02 ... NO NO NO SI PENDIENTE NO ESPECIFICADO México 99 NO APLICA IZÚCAR DE MATAMOROS
620305 2020-07-21 003ca9 2 IMSS 22 HOMBRE QUERETARO QUERETARO AMBULATORIA 2020-02-07 ... NO NO NO NO ESPECIFICADO PENDIENTE NO ESPECIFICADO México 99 NO APLICA QUERÉTARO
629360 2020-07-21 063f1e 2 IMSS 20 HOMBRE OAXACA OAXACA AMBULATORIA 2020-01-30 ... NO NO NO NO ESPECIFICADO PENDIENTE NO ESPECIFICADO México 99 NO APLICA NAZARENO ETLA
631085 2020-07-21 06cf4c 2 SSA 21 MUJER PUEBLA PUEBLA AMBULATORIA 2020-03-30 ... NO NO NO NO PENDIENTE NO ESPECIFICADO México 99 NO APLICA PUEBLA
633406 2020-07-21 114288 2 IMSS 19 MUJER NUEVO LEON NUEVO LEON HOSPITALIZADO 2020-05-15 ... SI SI SI NO ESPECIFICADO PENDIENTE NO ESPECIFICADO México 99 NO LINARES

19 rows × 35 columns

Como primera visualización podemos ver una gráfica de barras los valores NEGATIVOS, POSITIVOS y PENDIENTES por día.

Confirmados con COVID-19

La columnaENTIDAD_RES contiene el Estado de México en el que el sujeto se encuentró al momento de registrar sus datos.

Podemos agrupar los datos y presentarlos en una tabla con un gradiente para mostrar los Estados con mayor número de casos de COVID-19.

ENTIDAD TOTAL
0 CIUDAD DE MEXICO 64431
1 MEXICO 47253
2 TABASCO 18068
3 VERACRUZ DE IGNACIO DE LA LLAVE 17406
4 PUEBLA 16602
5 GUANAJUATO 15564
6 SONORA 14947
7 NUEVO LEON 13021
8 BAJA CALIFORNIA 12155
9 TAMAULIPAS 11851
10 SINALOA 11683
11 JALISCO 10827
12 COAHUILA DE ZARAGOZA 9909
13 GUERRERO 9277
14 OAXACA 8949
15 MICHOACAN DE OCAMPO 8229
16 YUCATAN 7483
17 QUINTANA ROO 6370
18 SAN LUIS POTOSI 6228
19 HIDALGO 5599
20 CHIAPAS 5489
21 CHIHUAHUA 4479
22 TLAXCALA 3911
23 MORELOS 3683
24 CAMPECHE 3667
25 AGUASCALIENTES 3544
26 DURANGO 3353
27 BAJA CALIFORNIA SUR 3231
28 QUERETARO 3008
29 NAYARIT 2870
30 ZACATECAS 1919
31 COLIMA 1249

O representarlo en una gráfica de barras.

También podemos agrupar los casos confirmados por día y su acumulado.

FECHA TOTAL TOTAL_ACCU
0 2020-01-13 00:00:00 1 1
1 2020-01-17 00:00:00 1 2
2 2020-01-29 00:00:00 1 3
3 2020-02-06 00:00:00 1 4
4 2020-02-07 00:00:00 1 5
5 2020-02-19 00:00:00 1 6
6 2020-02-21 00:00:00 1 7
7 2020-02-22 00:00:00 2 9
8 2020-02-23 00:00:00 1 10
9 2020-02-25 00:00:00 1 11
10 2020-02-26 00:00:00 1 12
11 2020-02-27 00:00:00 2 14
12 2020-02-28 00:00:00 2 16
13 2020-02-29 00:00:00 2 18
14 2020-03-01 00:00:00 6 24
15 2020-03-02 00:00:00 8 32
16 2020-03-03 00:00:00 6 38
17 2020-03-04 00:00:00 7 45
18 2020-03-05 00:00:00 7 52
19 2020-03-06 00:00:00 10 62
20 2020-03-07 00:00:00 21 83
21 2020-03-08 00:00:00 21 104
22 2020-03-09 00:00:00 62 166
23 2020-03-10 00:00:00 50 216
24 2020-03-11 00:00:00 51 267
25 2020-03-12 00:00:00 60 327
26 2020-03-13 00:00:00 87 414
27 2020-03-14 00:00:00 91 505
28 2020-03-15 00:00:00 100 605
29 2020-03-16 00:00:00 133 738
30 2020-03-17 00:00:00 110 848
31 2020-03-18 00:00:00 124 972
32 2020-03-19 00:00:00 112 1084
33 2020-03-20 00:00:00 182 1266
34 2020-03-21 00:00:00 130 1396
35 2020-03-22 00:00:00 141 1537
36 2020-03-23 00:00:00 222 1759
37 2020-03-24 00:00:00 181 1940
38 2020-03-25 00:00:00 210 2150
39 2020-03-26 00:00:00 247 2397
40 2020-03-27 00:00:00 289 2686
41 2020-03-28 00:00:00 271 2957
42 2020-03-29 00:00:00 263 3220
43 2020-03-30 00:00:00 381 3601
44 2020-03-31 00:00:00 307 3908
45 2020-04-01 00:00:00 462 4370
46 2020-04-02 00:00:00 437 4807
47 2020-04-03 00:00:00 443 5250
48 2020-04-04 00:00:00 452 5702
49 2020-04-05 00:00:00 430 6132
50 2020-04-06 00:00:00 580 6712
51 2020-04-07 00:00:00 512 7224
52 2020-04-08 00:00:00 626 7850
53 2020-04-09 00:00:00 627 8477
54 2020-04-10 00:00:00 961 9438
55 2020-04-11 00:00:00 723 10161
56 2020-04-12 00:00:00 775 10936
57 2020-04-13 00:00:00 963 11899
58 2020-04-14 00:00:00 909 12808
59 2020-04-15 00:00:00 1044 13852
60 2020-04-16 00:00:00 1028 14880
61 2020-04-17 00:00:00 1163 16043
62 2020-04-18 00:00:00 1261 17304
63 2020-04-19 00:00:00 1144 18448
64 2020-04-20 00:00:00 1852 20300
65 2020-04-21 00:00:00 1204 21504
66 2020-04-22 00:00:00 1244 22748
67 2020-04-23 00:00:00 1303 24051
68 2020-04-24 00:00:00 1549 25600
69 2020-04-25 00:00:00 1608 27208
70 2020-04-26 00:00:00 1437 28645
71 2020-04-27 00:00:00 1761 30406
72 2020-04-28 00:00:00 1556 31962
73 2020-04-29 00:00:00 1407 33369
74 2020-04-30 00:00:00 1949 35318
75 2020-05-01 00:00:00 2648 37966
76 2020-05-02 00:00:00 1909 39875
77 2020-05-03 00:00:00 1818 41693
78 2020-05-04 00:00:00 2307 44000
79 2020-05-05 00:00:00 2327 46327
80 2020-05-06 00:00:00 2080 48407
81 2020-05-07 00:00:00 2326 50733
82 2020-05-08 00:00:00 2694 53427
83 2020-05-09 00:00:00 2372 55799
84 2020-05-10 00:00:00 3214 59013
85 2020-05-11 00:00:00 2982 61995
86 2020-05-12 00:00:00 2678 64673
87 2020-05-13 00:00:00 2620 67293
88 2020-05-14 00:00:00 2627 69920
89 2020-05-15 00:00:00 3884 73804
90 2020-05-16 00:00:00 2965 76769
91 2020-05-17 00:00:00 2836 79605
92 2020-05-18 00:00:00 4075 83680
93 2020-05-19 00:00:00 3166 86846
94 2020-05-20 00:00:00 4328 91174
95 2020-05-21 00:00:00 2993 94167
96 2020-05-22 00:00:00 3802 97969
97 2020-05-23 00:00:00 3506 101475
98 2020-05-24 00:00:00 3288 104763
99 2020-05-25 00:00:00 4977 109740
100 2020-05-26 00:00:00 3640 113380
101 2020-05-27 00:00:00 3487 116867
102 2020-05-28 00:00:00 3961 120828
103 2020-05-29 00:00:00 4008 124836
104 2020-05-30 00:00:00 3860 128696
105 2020-05-31 00:00:00 3602 132298
106 2020-06-01 00:00:00 6545 138843
107 2020-06-02 00:00:00 4081 142924
108 2020-06-03 00:00:00 4032 146956
109 2020-06-04 00:00:00 4204 151160
110 2020-06-05 00:00:00 5179 156339
111 2020-06-06 00:00:00 4873 161212
112 2020-06-07 00:00:00 4129 165341
113 2020-06-08 00:00:00 5467 170808
114 2020-06-09 00:00:00 4462 175270
115 2020-06-10 00:00:00 5997 181267
116 2020-06-11 00:00:00 4334 185601
117 2020-06-12 00:00:00 5094 190695
118 2020-06-13 00:00:00 4523 195218
119 2020-06-14 00:00:00 4391 199609
120 2020-06-15 00:00:00 6736 206345
121 2020-06-16 00:00:00 5083 211428
122 2020-06-17 00:00:00 4363 215791
123 2020-06-18 00:00:00 5352 221143
124 2020-06-19 00:00:00 5462 226605
125 2020-06-20 00:00:00 7014 233619
126 2020-06-21 00:00:00 4478 238097
127 2020-06-22 00:00:00 5697 243794
128 2020-06-23 00:00:00 4911 248705
129 2020-06-24 00:00:00 4843 253548
130 2020-06-25 00:00:00 5681 259229
131 2020-06-26 00:00:00 6130 265359
132 2020-06-27 00:00:00 4833 270192
133 2020-06-28 00:00:00 5747 275939
134 2020-06-29 00:00:00 5986 281925
135 2020-06-30 00:00:00 5791 287716
136 2020-07-01 00:00:00 7258 294974
137 2020-07-02 00:00:00 5305 300279
138 2020-07-03 00:00:00 5548 305827
139 2020-07-04 00:00:00 4963 310790
140 2020-07-05 00:00:00 5194 315984
141 2020-07-06 00:00:00 5652 321636
142 2020-07-07 00:00:00 4965 326601
143 2020-07-08 00:00:00 4358 330959
144 2020-07-09 00:00:00 4187 335146
145 2020-07-10 00:00:00 5499 340645
146 2020-07-11 00:00:00 3429 344074
147 2020-07-12 00:00:00 3205 347279
148 2020-07-13 00:00:00 3229 350508
149 2020-07-14 00:00:00 2176 352684
150 2020-07-15 00:00:00 1847 354531
151 2020-07-16 00:00:00 1017 355548
152 2020-07-17 00:00:00 485 356033
153 2020-07-18 00:00:00 157 356190
154 2020-07-19 00:00:00 40 356230
155 2020-07-20 00:00:00 25 356255

No solo podemos revisar los casos confirmados también ver el número de fallecimientos por día y su acumulado.

Antes de las visualizaciones observamos otra inconsistencia en sujetos que tienen registrada una fecha de defunción pero antes de que se registrará la fecha de los sintomas o personas con fecha de fallecimiento antes de los primeros casos de COVID-19 en México.

Comó se menciono anteriormente, esto puede ser por un error al registrar los datos.

FECHA_ACTUALIZACION ID_REGISTRO ORIGEN SECTOR ENTIDAD_UM SEXO ENTIDAD_NAC ENTIDAD_RES TIPO_PACIENTE FECHA_INGRESO FECHA_SINTOMAS FECHA_DEF INTUBADO NEUMONIA
403211 2020-07-21 14ca54 2 IMSS 11 HOMBRE GUANAJUATO GUANAJUATO HOSPITALIZADO 2020-02-11 2020-02-11 2020-03-01 SI SI
623608 2020-07-21 1731ab 1 IMSS 9 MUJER MEXICO CIUDAD DE MEXICO HOSPITALIZADO 2020-05-24 2020-05-24 2020-04-13 NO SI

Una manera de visualizar los datos de confirmados y fallecimientos es mediante un gráfico de área ya que en este caso los fallecimientos contados son un grupo de los sujetos confirmados y podemos comparar su proporción.

O gráficar con barras para cada día.

Preguntas que podemos explorar

Utilizando los datos de los casos confirmados, ¿Cuántos ingresaron en hospitales?

Para esto ocupamos la columna TIPO_PACIENTE que contiene valores como Hospitalizado que significa que esta o estuvo presente en un Hospital y Ambulatoria que significa que fue confirmado con COVID-19 pero que no ingreso a un hospital.

Seleccionando a los sujetos confirmados con COVID-19 y que se ingresaron en algún hospital, ¿Cuántos fueron entubados?

Para responder esto ocupamos la columna INTUBADO en la que se señala si el sujeto tuvo que ser intubado como un signo de la complicación de la enfermedad.

TIPO_PACIENTE SEXO CONTEOS
0 AMBULATORIA HOMBRE 128558
1 AMBULATORIA MUJER 126757
2 HOSPITALIZADO HOMBRE 62331
3 HOSPITALIZADO MUJER 38609

Podemos ocupar un gráfico de box plot para saber la distribución de la edad de las personas confirmadas que se encontraron en el hospital.

Podemos crear rangos de edad y observar que grupo es el que ha presentado más casos que requieran hospitalización.

En México siempre se ha mantenido las "noticias" acerca de que los hospitales se encuentran llenos y hemos visto las conferencias acerca de la expansión en hospitales dependendiendo de la situación que se encuentran los Estados. Lamentablemente, con los datos que estamos trabajando en este momento no hay información de esta capacidad en hospitales pero si podemos visualizar el número de personas que se encontraron en los distintos tipos de hospitales.

Commorbilidades

Otro problema que existe en México son las enfermedades que complican la condición del paciente con COVID-19. Entre las más importantes se encuentran Obesidad, Diabetes e Hipertensión. Observando los datos registrados hasta 2016, México presenta un crecimiento en el porcentaje de adultos con obesidad cada año. La siguente gráfica muestra el porcentaje en distintos paises desde 1975 al 2016, incluyendo Mexico.

Ahora en relación con COVID-19, podemos ver el número de personas confirmadas, saber si presentan obesidad y su condición en el hospital.

La misma situación pero con las otras dos cormobilidades, Diabetes e hipertension que estan estrechamente relacionadas con la Obesidad.

Siguiendo el interés de las co-morbilidades podemos clasificar cada paciente con el número de las enfermades que se mencionaron anteriormente ya que son las que presentaron y presentan un mayor riesgo.

Hasta el momento, solo hemos explorado los datos de las personas confirmadas con COVID-19 desde el inicio de la pandemia en México, no las personas que actualmente presentan la enfermedad.

Usando el número de personas confirmadas con COVID19 y con la población total de cada Estado (datos de 2017) podemos determinar el número total de fallecimientos en cada Estado por cada 100 000 habitantes.

O la otra manera que podemos ver los lamentables fallecimientos es por el total de confirmados de COVID-19 en cada Estado. No es la forma más adecuada de ver estos datos, ya que como han explicado, depende mucho del número de pruebas que se hacen. Por lo que muchas pruebas solo reduciría la proporción de fallecimientos por total de confirmados. Pero puede ser útil para ver algúna localidad en la que la proporcion de falleciemientos aumente y tratar de determinar las posibles causas.

Otra manera de ver la relación entre el número de fallecimientos y el número de confirmados mediante un gráfico denominado scatterplot en el que cada punto representa una entidad Federativa.

El siguiente gráfico muestra los casos confirmados en cada Estado desde el inicio de la pandemia en México hasta el día de hoy.

Ya que los datos presentan tanto el Estado como el minicipio podemos realizar un gráfico denominado treemap que nos permite observar los casos totales por localidad y el tamaño de los cuadros es por número correspondiente.

En el caso de los Recuperados, según los informes de la Secretaría de Salud, son los casos después de 15 días al inicio de los síntomas.

Si seleccionamos los casos confirmados de las últimas dos semanas tendríamos los casos que se consideran activos ya que se toma en cuenta que la enfermedad tiene una duración promedio de 14 días. Puede ser que esta restricción no contemple todos los activos ya que pueden existir casos en los que la recuperación sea lenta sin embargo, una alta proporcion de los casos activos se encuentran con el criterio tomado.

Podemos ocupar estos casos activos para generar un treemap.

Duración epidémica

También es posible explorar la duración de la epidemia COVID19 en cada uno de los Estados. Esto quiere decir tomar el registro de cuando se dio el primer caso confirmado de COVID19 en cada uno de los Estados y continuar el lapso hasta el último día en el que se registro una confirmació. De esta manera podremos ver si algún Estado ha dejado de tener casos.

Debido a los errores al momento de registrar los datos, como se mencionó anteriormente, se tomarán en cuenta solo los datos a partir de inicios de Marzo 2020 que fue de las fechas oficiales.

Teniendo en cuenta este último gráfico, podemos revisar por día como fueron los distintos casos (no acumulados).

El siguente calendario muestra la intensidad de los casos confirmados en todo México por día. Es necesario considerar que debido a los errores de anotación que se describieron anteriormente el calendario iniciaria en Enero y Febrero cuando no en realidad no fue asi. Sin embargo, no se eliminaron ya que cuentan como casos postivos.

También es posible revisar los casos recuperados y observarlos en un calendario.

Y por último los fallecimientos por día.